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RESUME


Le premier livre numérique date de juillet 1971. Il s'agit du eText #1
du Projet Gutenberg, un projet visionnaire lancé par Michael Hart pour
créer des versions électroniques d'oeuvres littéraires et les diffuser
dans le monde entier. Au 16e siècle, Gutenberg avait permis à chacun
d'avoir des livres imprimés pour un prix relativement modique. Au 21e
siècle, le Projet Gutenberg permettrait à chacun d'avoir une
bibliothèque numérique gratuite. Ce projet trouve un second souffle et
un rayonnement international avec l'apparition du web en 1990 puis la
création de Distributed Proofreaders en 2000, pour partager la
relecture des livres entre des milliers de volontaires. En 2009, le
site originel du Projet Gutenberg compte 3 millions de téléchargements
par mois, sans compter les téléchargements des 38 sites miroirs
répartis sur toute la planète.



UN PARI DEPUIS 38 ANS


# Gestation

Quels furent les tous débuts du projet? Alors étudiant à l’Université
d’Illinois (Etats-Unis), Michael Hart se voit attribuer quelques
millions de dollars de «temps machine» dans le laboratoire informatique
(Materials Research Lab) de son université. Le 4 juillet 1971, jour de
la fête nationale, il saisit "The United States Declaration of
Independence" (Déclaration de l’indépendance des Etats-Unis, signée le
4 juillet 1776) sur le clavier de son ordinateur. En caractères
majuscules, puisque les caractères minuscules n’existent pas encore. Le
texte électronique représente 5 Ko (kilo-octets). Mais l’envoi d’un
fichier de 5 Ko à la centaine de personnes que représente le réseau de
l’époque aurait fait imploser celui-ci, la bande passante étant infime.
Michael diffuse donc un message indiquant où le texte est stocké - sans
lien hypertexte toutefois, puisque le web ne voit le jour que vingt ans
après - suite à quoi le fichier est téléchargé par six personnes.

Dans la foulée, Michael décide de consacrer ce crédit-temps de quelques
millions de dollars à la recherche des oeuvres du domaine public
disponibles en bibliothèque et à la numérisation de celles-ci. Il
décide aussi de stocker les textes électroniques de la manière la plus
simple possible, au format ASCII, pour que ces textes puissent être lus
sans problème quels que soient la machine, la plateforme et le logiciel
utilisés. Au lieu d’être un ensemble de pages reliées, le livre devient
un texte électronique que l’on peut dérouler en continu, avec des
lettres capitales pour les termes en italique, en gras et soulignés de
la version imprimée.

Peu après, Michael définit la mission du Projet Gutenberg: mettre à la
disposition de tous, par voie électronique, le plus grand nombre
possible d’oeuvres du domaine public. «Nous considérons le texte
électronique comme un nouveau médium, sans véritable relation avec le
papier, explique-t-il plus tard, en août 1998. Le seul point commun est
que nous diffusons les mêmes oeuvres, mais je ne vois pas comment le
papier peut concurrencer le texte électronique une fois que les gens y
sont habitués, particulièrement dans les écoles.»

Après avoir saisi "The United States Declaration of Independence en
1971", Michael poursuit ses efforts en 1972 en saisissant un texte plus
long, "The United States Bill of Rights" (Déclaration des droits
américaine). Cette Déclaration des droits comprend les dix premiers
amendements ajoutés en 1789 à la Constitution des Etats-Unis (qui date
elle-même de 1787), et définissant les droits individuels des citoyens
et les pouvoirs respectifs du gouvernement fédéral et des Etats. En
1973, un volontaire saisit "The United States Constitution"
(Constitution des Etats-Unis) dans son entier.


# Persévérance

D’année en année, la capacité de la disquette augmente régulièrement -
le disque dur n’existe pas encore - si bien qu'il est possible
d’envisager des fichiers de plus en plus volumineux. Des volontaires
entreprennent la numérisation de la Bible, composée elle-même de
plusieurs livres, qui peuvent être traités séparément et occuper chacun
un fichier différent.

Michael Hart débute la saisie des oeuvres complètes de Shakespeare, une
pièce après l’autre, avec un fichier pour chaque pièce. Cette version
n'est d’ailleurs jamais mise en ligne, du fait d’une loi plus
contraignante sur le copyright entrée en vigueur dans l’intervalle, et
qui vise non pas le texte de Shakespeare, tombé depuis longtemps dans
le domaine public, mais les commentaires et notes de l'édition
correspondante. D’autres éditions annotées appartenant au domaine
public seront mises en ligne quelques années plus tard.

Parallèlement, l’internet, qui était encore embryonnaire en 1971,
débute véritablement en 1974, suite à la création du protocole TCP/IP
(transmission control protocol/internet protocol). En 1983, le réseau
est en plein essor.


# De 10 à 1.000 ebooks

En août 1989, le Projet Gutenberg met en ligne son dixième texte, "The
King James Bible", publiée pour la première fois en 1611 et dont la
version la plus connue date de 1769. L'ensemble des fichiers de
l'Ancien Testament et du Nouveau Testament représente 5 Mo (méga-
octets).

En 1990, les internautes sont au nombre de 250.000, et le standard en
vigueur est la disquette de 360 Ko. En janvier 1991, Michael Hart
saisit "Alice’s Adventures in Wonderland" (Alice au pays des
merveilles) de Lewis Carroll (paru en 1865). En juillet de la même
année, il saisit "Peter Pan" de James M. Barrie (paru en 1904). Ces
deux classiques de la littérature enfantine tiennent chacun sur une
disquette standard.

Arrive ensuite le web, opérationnel en 1991. Le premier navigateur,
Mosaic, apparaît en novembre 1993. Lorsque l’utilisation du web se
généralise, il devient plus facile de faire circuler les textes
électroniques et de recruter des volontaires.

Le Projet Gutenberg rode sa méthode de travail, avec la numérisation
d’un texte par mois en 1991, deux textes par mois en 1992, quatre
textes par mois en 1993 et huit textes par mois en 1994.

En janvier 1994, le Projet Gutenberg fête son centième livre avec la
mise en ligne de "The Complete Works of William Shakespeare" (Les
oeuvres complètes de William Shakespeare). Shakespeare écrivit
l'essentiel de son oeuvre entre 1590 et 1613.

La production continue ensuite d’augmenter, avec une moyenne de 8
textes par mois en 1994, 16 textes par mois en 1995 et 32 textes par
mois en 1996.

Comme on le voit, entre 1991 et 1996, la production double chaque
année. Tout en continuant de numériser des livres, Michael coordonne
désormais le travail de dizaines de volontaires.

Depuis la fin 1993, le Projet Gutenberg s’articule en trois grands
secteurs: a) Light Literature (littérature de divertissement), qui
inclut par exemple "Alice’s Adventures in Wonderland", "Peter Pan" ou
"Aesop’s Fables" (Les Fables d’Esope); b) Heavy Literature (littérature
«sérieuse»), qui inclut par exemple La Bible, les oeuvres de
Shakespeare ou "Moby Dick"; c) Reference Literature (littérature de
référence), composée d’encyclopédies et de dictionnaires, par exemple
le "Roget’s Thesaurus". Cette présentation en trois secteurs est
abandonnée par la suite pour laisser place à un classement par
rubriques plus détaillé.

Le Projet Gutenberg se veut universel, aussi bien pour les oeuvres
choisies que pour le public visé, le but étant de mettre la littérature
à la disposition de tous, en dépassant largement le public habituel des
étudiants et des enseignants. Le secteur consacré à la littérature de
divertissement est destiné à amener devant l’écran un public très
divers, par exemple des enfants et leurs grands-parents recherchant le
texte électronique de "Peter Pan" après avoir vu le film Hook, ou
recherchant la version électronique d’"Alice au pays des merveilles"
après avoir regardé l'adaptation filmée à la télévision, ou recherchant
l’origine d’une citation littéraire après avoir vu un épisode de Star
Trek. Pratiquement tous les épisodes de Star Trek citent des livres
ayant leur correspondant numérique dans le Projet Gutenberg.

L’objectif est donc que le public, qu’il soit familier ou non avec le
livre imprimé, puisse facilement retrouver des textes entendus dans des
conversations, des films, des musiques, ou alors lus dans d’autres
livres, journaux et magazines. Les fichiers électroniques prennent peu
de place grâce à l’utilisation du format ASCII. On peut facilement les
télécharger par le biais de la ligne téléphonique. La recherche
textuelle est tout aussi simple. Il suffit d’utiliser la fonction
«chercher» présente dans n’importe quel logiciel.

En 1997, la production est toujours de 32 titres par mois. En juin
1997, le Projet Gutenberg met en ligne "The Merry Adventures of Robin
Hood" (Les aventures de Robin des Bois) de Howard Pyle (paru en 1883).
En août 1997, il met en ligne son millième texte électronique, "La
Divina Commedia" (La Divine Comédie) de Dante Alighieri (parue en
1321), dans sa langue d’origine, en italien.

En août 1998, Michael Hart écrit: «Mon projet est de mettre 10.000
textes électroniques sur l’internet. (Ce sera chose faite en octobre
2003, ndlr.) Si je pouvais avoir des subventions importantes,
j’aimerais aller jusqu’à un million et étendre aussi le nombre de nos
usagers potentiels de 1,x% à 10% de la population mondiale, ce qui
représenterait la diffusion de 1.000 fois un milliard de textes
électroniques, au lieu d’un milliard seulement.»


# De 1.000 à 10.000 ebooks

Entre 1998 et 2000, la moyenne est constante, avec 36 textes par mois.
En mai 1999, les collections comptent 2.000 livres. Le 2.000e texte est
Don Quijote (Don Quichotte) de Cervantès (paru en 1605), dans sa langue
d’origine, en espagnol.

Disponible en décembre 2000, le 3.000e titre est le troisième volume de
"A l’ombre des jeunes filles en fleurs" de Marcel Proust (paru en
1919), dans sa langue d'origine, en français. La moyenne passe à 104
livres par mois en 2001.

Mis en ligne en octobre 2001, le 4.000e texte est "The French Immortals
Series" (La série des Immortels français), dans sa traduction anglaise.
Publié à Paris en 1905 par la Maison Mazarin, ce livre rassemble
plusieurs fictions d’écrivains couronnés par l’Académie française,
comme Emile Souvestre, Pierre Loti, Hector Malot, Charles de Bernard,
Alphonse Daudet, etc.

Disponible en avril 2002, le 5.000e texte est "The Notebooks of
Leonardo da Vinci" (Les Carnets de Léonard de Vinci), qui datent du
début du 16e siècle. Un texte qui, en 2009, se trouve toujours dans le
Top 100 des livres téléchargés.

En 1988, Michael Hart choisit de numériser "Alice’s Adventures in
Wonderland" et "Peter Pan" parce que, dans l’un et l’autre cas, leur
version numérisée tient sur une disquette de 360 Ko, le standard de
l’époque. Quinze ans plus tard, en 2002, on dispose de disquettes de
1,44 Mo et on peut aisément compresser les fichiers en les zippant. Un
fichier standard peut désormais comporter trois millions de caractères,
plus qu’il n’en faut pour un livre de taille moyenne, puisqu'un roman
de 300 pages numérisé au format ASCII représente un mégaoctet. Un livre
volumineux tient sur deux fichiers ASCII, téléchargeables tels quels ou
en version zippée. Cinquante heures environ sont nécessaires pour
sélectionner un livre de taille moyenne, vérifier qu’il est bien du
domaine public, le scanner, le corriger, le formater et le mettre en
page.

Quelques numéros de livres sont réservés pour l’avenir, par exemple le
numéro 1984 (eBook #1984) pour le roman éponyme de George Orwell,
publié en 1949, et qui est donc loin d’être tombé dans le domaine
public.

En 2002, les collections s’accroissent de 203 titres par mois. Au
printemps 2002, elles représentent le quart des oeuvres du domaine
public en accès libre sur le web, recensées de manière pratiquement
exhaustive par l’Internet Public Library (IPL). Un beau résultat dû au
patient travail de milliers de volontaires actifs dans de nombreux
pays.

1.000 livres en août 1997, 2.000 livres en mai 1999, 3.000 livres en
décembre 2000, 4.000 livres en octobre 2001, 5.000 livres en avril
2002, 10.000 livres en octobre 2003. Le 10.000e livre est The Magna
Carta, qui fut le premier texte constitutionnel anglais, signé en 1215.

Entre avril 2002 et octobre 2003, les collections doublent, passant de
5.000 à 10.000 livres en dix-huit mois. La moyenne mensuelle est de 348
livres numérisés en 2003.

Dix mille livres. Un chiffre impressionnant quand on pense à ce que
cela représente de pages scannées, relues et corrigées. Cette
croissance rapide est due à l’activité de Distributed Proofreaders
(DP), un site conçu en 2000 par Charles Franks pour permettre la
correction partagée. Les volontaires choisissent un livre en cours de
traitement pour relire et corriger une page donnée. Chacun travaille à
son propre rythme. A titre indicatif, il est conseillé de relire une
page par jour. C’est peu de temps sur une journée, et c’est beaucoup
pour le projet.

En août 2003, un CD "Best of Gutenberg" est disponible avec une
sélection de 600 livres. En décembre 2003, date à laquelle le Projet
Gutenberg franchit la barre des 10.000 livres, la quasi-totalité des
livres (9.400 livres) est gravée sur un DVD. CD et DVD sont envoyés
gratuitement à qui en fait la demande. Libre ensuite à chacun de faire
autant de copies que possible et de les distribuer autour de soi.


# De 10.000 à 20.000 ebooks

En décembre 2003, les collections approchent les 11.000 livres.
Plusieurs formats sont désormais présents, par exemple les formats
HTML, XML et RTF, le format principal - et obligatoire - restant
l’ASCII. Le tout représente 46.000 fichiers, soit une capacité totale
de 110 gigaoctets. Le 13 février 2004, date de la conférence de Michael
Hart au siège de l’UNESCO à Paris, les collections comprennent très
exactement 11.340 livres dans 25 langues. En mai 2004, les 12.500
livres disponibles représentent 100.000 fichiers dans vingt formats
différents, soit une capacité totale de 135 Go (giga-octets), destinée
à doubler chaque année avec l’ajout d'environ 300 livres par mois (338
livres en 2004).

Parallèlement, le Project Gutenberg Consortia Center (PGCC), qui avait
été lancé en 1997 pour rassembler des collections de livres numériques
déjà existantes et provenant de sources extérieures, est officiellement
affilié au Projet Gutenberg en 2003.

Par ailleurs, un projet européen est lancé à l’instigation du Projet
Rastko, basé à Belgrade, en Serbie. Distributed Proofreaders Europe
débute en décembre 2003, et Projet Gutenberg Europe en janvier 2004,
avec cent livres disponibles en avril 2005. Les livres sont en
plusieurs langues pour refléter la diversité linguistique prévalant en
Europe, avec cent langues prévues sur le long terme.

En janvier 2005, le Projet Gutenberg fête ses 15.000 livres, avec la
mise en ligne de "The Life of Reason" de George Santayana (paru en
1906).

En juin 2005, le nombre de livres s’élève à 16.000. Si 25 langues
seulement étaient présentes en février 2004, 42 langues sont
représentées en juin 2005, dont l’iroquois, le sanscrit et les langues
mayas.En décembre 2006, on compte 50 langues. A la date du 16 décembre
2006, les langues comprenant plus de 50 titres sont l’anglais (17.377
livres), le français (966 titres), l’allemand (412 titres), le finnois
(344 titres), le hollandais (244 titres), l’espagnol (140 titres),
l’italien (102 titres), le chinois (69 titres), le portugais (68
titres) et le tagalogue (51 titres).

Lancé en août 2001, le Project Gutenberg Australia fête ses 500 livres
en juillet 2005, tandis que le Project Gutenberg Canada est en
gestation, tout comme un Projet Gutenberg au Portugal et un autre aux
Philippines.

En décembre 2006, le Projet Gutenberg franchit la barre des 20.000
livres. Le 20.000e livre est un livre audio, "Twenty Thousand Leagues
Under the Sea", version anglaise de "Vingt mille lieues sous les mers
de Jules Verne" (publié en 1869). La moyenne est de 345 nouveaux livres
par mois en 2006.

S'il a fallu 32 ans, de juillet 1971 à octobre 2003, pour numériser les
10.000 premiers livres, il n’aura fallu que trois ans et deux mois,
d’octobre 2003 à décembre 2006, pour numériser les 10.000 livres
suivants.

A la même date, le Project Gutenberg Australia approche les 1.500
livres (c'est chose faite en avril 2007) et le Projet Gutenberg Europe
compte 400 livres.

La section Project Gutenberg PrePrints débute en janvier 2006 pour
accueillir de nouveaux documents suffisamment intéressants pour être
mis en ligne, mais ne pouvant être intégrés aux collections existantes
sans traitement ultérieur par des volontaires, pour diverses raisons:
collections incomplètes, qualité insuffisante, conversion souhaitée
dans un autre format, etc. Cette section comprend 379 titres en
décembre 2006.


# Des dizaines de milliers d'ebooks

Project Gutenberg News débute en novembre 2006 à l’instigation de Mike
Cook. Il s'agit d'un site web qui complète la lettre d’information
hebdomadaire et mensuelle existant depuis nombre d'années. Le site
offre par exemple les statistiques de production hebdomadaires,
mensuelles et annuelles depuis 2001. La production hebdomadaire est de
24 livres en 2001, 47 livres en 2002, 79 livres en 2003, 78 livres en
2004, 58 livres en 2005, 80 livres en 2006 et 78 livres en 2007. La
production mensuelle est de 104 livres en 2001, 203 livres en 2002, 348
livres en 2003, 338 livres en 2004, 252 livres en 2005, 345 livres en
2006 et 338 livres en 2007. La production annuelle est de 1.244 livres
en 2001, 2.432 livres en 2002, 4.176 livres en 2003, 4.058 livres en
2004, 3.019 livres en 2005, 4.141 livres en 2006 et 4.049 livres en
2007.

Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, le
jour de la fête nationale, à l'instigation de Michael Shepard et David
Jones. Il est suivi de Distributed Proofreaders Canada (DPC), avec une
production qui débute en décembre 2007. Les cent premiers livres sont
disponibles en mars 2008, avec des livres en anglais, en français et en
italien.

Distributed Proofreaders (DP), lancé en octobre 2000, comptabilise
52.000 volontaires en janvier 2008, avec un nombre total de 11.950
livres traités en sept ans et trois mois. Distributed Proofreaders
Europe (DP Europe), lancé en décembre 2003, comptabilise 1.500
volontaires. Distributed Proofreaders Canada (DPC), lancé en décembre
2007, comptabilise 250 volontaires.

Le Projet Gutenberg franchit la barre des 25.000 livres en avril 2008.
Le 25.000e livre est "English Book Collectors", de William Younger
Fletcher (publié en 1902).

Le Projet Gutenberg comptabilise 32.500 ebooks le 1er mars 2009 pour
l'ensemble de ses sites, avec 28.147 ebooks pour le Project Gutenberg
USA, 1.750 ebooks pour le Project Gutenberg Australia, 600 ebooks pour
le Project Gutenberg Europe et 250 ebooks pour le Project Gutenberg
Canada, auxquels il convient d'ajouter les 2.020 ebooks de la section
PrePrints. Le Project Gutenberg Consortia Center (PGCC) – qui rassemble
des collections de livres numérisés par d'autres sources - comptabilise
75.000 ebooks à la même date.



DOMAINE PUBLIC ET COPYRIGHT


Chose inquiétante à l’heure d’une société dite de l’information, le
domaine public se réduit comme peau de chagrin. A une époque qui n'est
pas si lointaine, 50% des oeuvres appartenaient au domaine public, et
pouvaient donc être librement utilisées par tous. D'ici 2100, 99% des
oeuvres seraient régies par le droit d’auteur, avec un maigre 1% laissé
au domaine public. Un problème épineux pour tous ceux qui gèrent des
bibliothèques numériques, et qui affecte aussi bien le Projet Gutenberg
que Google Books.

Si le Projet Gutenberg s’est donné pour mission de diffuser
gratuitement par voie électronique le plus grand nombre possible
d’oeuvres du domaine public, sa tâche n’est guère facilitée par les
coups de boutoir portés au domaine public. Michael Hart, son fondateur,
se penche sur la question depuis plus de trente ans, avec l’aide d’un
groupe d’avocats spécialisés dans le droit d’auteur.

Dans la section Copyright HowTo, le Projet Gutenberg détaille les
calculs à faire pour déterminer si un titre publié aux Etats-Unis
appartient ou non au domaine public. Les oeuvres publiées avant 1923
sont soumises au droit d’auteur pendant 75 ans à partir de leur date de
publication (elles sont donc maintenant dans le domaine public). Les
oeuvres publiées entre 1923 et 1977 sont soumises au droit d’auteur
pendant 95 ans à partir de leur date de publication (rien ne tombera
dans le domaine public avant 2019). Une oeuvre publiée en 1998 et les
années suivantes est soumise au droit d’auteur pendant 70 ans à partir
de la date du décès de l’auteur s’il s’agit d’un auteur personnel (rien
dans le domaine public avant 2049), ou alors pendant 95 ans à partir de
la date de publication - ou 120 ans à partir de la date de création -
s’il s’agit d’un auteur collectif (rien dans le domaine public avant
2074). Tout ceci dans les grandes lignes. D’autres règles viennent
s’ajouter à ces règles de base, la loi sur le copyright ayant été
amendée plusieurs fois fois depuis 1971, date de fondation du Projet
Gutenberg.

Nettement plus contraignant que l'amendement précédent, une nouveau
renforcement du copyright est entériné par le Congrès le 27 octobre
1998 pour contrer le formidable véhicule de diffusion qu'est
l'internet. Au fil des siècles, chaque avancée technique est
accompagnée d'un durcissement du copyright, qui semble être la réponse
des éditeurs à un accès plus facile au savoir, et la peur afférente de
perdre des royalties. «Le copyright a été augmenté de 20 ans, explique
Michael Hart en juillet 1999. Auparavant on devait attendre 75 ans, on
est maintenant passé à 95 ans. Bien avant, le copyright durait 28 ans
(plus une extension de 28 ans si on la demandait avant l’expiration du
délai) et, avant cela, le copyright durait 14 ans (plus une extension
de 14 ans si on la demandait avant l’expiration du délai). Comme on le
voit, on assiste à une dégradation régulière et constante du domaine
public.»

Les dates évoquées par Michael sont les suivantes, comme expliqué en
détail dans son blog:

(a) 1790 est la date de la main-mise de la Guilde des imprimeurs (les
éditeurs de l’époque en Angleterre) sur les auteurs, qui entraîne la
naissance du copyright. Le 1790 Copyright Act institue un copyright de
14 ans après la date de publication de l’oeuvre, plus une extension de
28 ans si celle-ci est demandée avant l’expiration du délai. Les
oeuvres pouvant être légalement imprimées passent subitement de 6.000 à
600, et neuf titres sur dix disparaissent des librairies. Quelque 335
ans après les débuts de l'imprimerie, censée ouvrir les portes du
savoir à tous, le monde du livre est désormais contrôlé par les
éditeurs et non plus par les auteurs. Cette nouvelle législation est
également effective aux Etats-Unis et en France.

(b) 1831 est la date d'un premier renforcement du copyright pour
contrer la réédition de vastes collections du domaine public sur les
nouvelles presses à vapeur. Le 1831 Copyright Act institue un copyright
de 28 ans après la date de publication de l’oeuvre, plus une extension
de 14 ans si celle-ci est demandée avant l’expiration du délai, à
savoir un total de 42 ans.

(c) 1909 est la date d'un deuxième renforcement du copyright pour
contrer une réédition des collections du domaine public sur les
nouvelles presses électriques. Le 1909 Copyright Act double la période
de l’extension, qui passe à 28 ans, le tout représentant un total de 56
ans.

(d) 1976 est la date d’un nouveau durcissement du copyright suite
l’apparition de la photocopieuse lancée par Xerox. Le 1976 Copyright
Act institue un copyright de 50 ans après le décès de l’auteur. De ce
fait, tout copyright en cours avant le 19 septembre 1962 n’expire pas
avant le 31 décembre 1976.

(e) 1998 est la date d’un durcissement supplémentaire du copyright
suite au développement rapide des technologies numériques et aux
centaines de milliers d'oeuvres désormais disponibles sur CD et DVD et
sur le web, gratuitement ou à un prix très bas. Le 1998 Copyright Act
allonge la durée du copyright qui est désormais de 70 ans après le
décès de l’auteur, pour protéger l'empire Disney (raison pour laquelle
on parle souvent de Mickey Mouse Copyright Act) et nombre de
multinationales culturelles.

Pour ne prendre qu'un exemple, le classique mondial "Gone With the
Wind" ("Autant en emporte le vent") de Margaret Mitchell, publié en
1939, aurait dû tomber dans le domaine public au bout de 56 ans, en
1995, conformément à la législation de l'époque, libérant ainsi les
droits pour les adaptations en tous genres. Suite aux législations de
1976 et 1998, ce classique ne devrait désormais tomber dans le domaine
public qu'en 2035.

La législation de 1998 porte un coup très rude aux bibliothèques
numériques, en plein essor avec le développement du web, et
scandalisent ceux qui les gèrent, à commencer par Michael Hart et John
Mark Ockerbloom, créateur de l'Online Books Page. Mais comment faire le
poids vis-à-vis des majors de l’édition? Nombre de titres doivent être
retirés des collections.

John Mark explique en août 1999: «A mon avis, il est important que les
internautes comprennent que le copyright est un contrat social conçu
pour le bien public - incluant à la fois les auteurs et les lecteurs.
Ceci signifie que les auteurs doivent avoir le droit d'utiliser de
manière exclusive et pour un temps limité les oeuvres qu'ils ont
créées, comme ceci est spécifié dans la loi actuelle sur le copyright.
Mais ceci signifie également que leurs lecteurs ont le droit de copier
et de réutiliser ce travail autant qu'ils le veulent à l'expiration de
ce copyright. Aux Etats-Unis, on voit maintenant diverses tentatives
visant à retirer ces droits aux lecteurs, en limitant les règles
relatives à l'utilisation de ces oeuvres, en prolongeant la durée du
copyright (y compris avec certaines propositions visant à le rendre
permanent) et en étendant la propriété intellectuelle à des travaux
distincts des oeuvres de création (comme on en trouve dans les
propositions de copyright pour les bases de données). Il existe même
des propositions visant à entièrement remplacer la loi sur le copyright
par une loi instituant un contrat beaucoup plus lourd. Je trouve
beaucoup plus difficile de soutenir la requête de Jack Valenti,
directeur de la MPAA (Motion Picture Association of America), qui
demande d'arrêter de copier les films sous copyright, quand je sais
que, si ceci était accepté, aucun film n'entrerait jamais dans le
domaine public (...). Si on voit les sociétés de médias tenter de
bloquer tout ce qu'elles peuvent, je ne trouve pas surprenant que
certains usagers réagissent en mettant en ligne tout ce qu'ils peuvent.
Malheureusement, cette attitude est à son tour contraire aux droits
légitimes des auteurs.»

Michael raconte en juillet 1999: «J’ai été le principal opposant aux
extensions du copyright, mais Hollywood et les grands éditeurs ont fait
en sorte que le Congrès ne mentionne pas mon action en public. Les
débats actuels sont totalement irréalistes. Ils sont menés par
“l’aristocratie terrienne de l’âge de l’information” et servent
uniquement ses intérêts. Un âge de l’information? Et pour qui?»

En effet. Les instances politiques ne cessent de parler d’âge de
l’information alors que, en parallèle, elles durcissent la
réglementation relative à la mise à disposition de cette information.
La contradiction est flagrante. Le copyright est passé d'une durée de
30 ans en moyenne en 1909 à une durée de 95 ans en moyenne en 1998,
explique aussi Michael dans son blog. En 89 ans, de 1909 à 1998, le
copyright a subi une extension de 65 ans qui affecte les trois quarts
de la production du 20e siècle. Seul un livre publié avant 1923 peut
être considéré avec certitude comme du domaine public.

Un durcissement similaire touche les pays de l'Union européenne. La
règle générale est désormais un copyright de 70 ans après le décès de
l’auteur, alors qu’il était auparavant de 50 ans, suite aux pressions
exercées par les éditeurs de contenu sous le prétexte d’«harmoniser»
les lois nationales relatives au copyright pour répondre à la
mondialisation du marché.



DU PASSE  VERS L'AVENIR


Les résultats du Projet Gutenberg ne se mesurent pas seulement à des
chiffres, qui restent assez modestes par rapport au nombre de livres
imprimés appartenant au domaine public. Les résultats se mesurent
également à l’influence du projet, qui est considérable. Premier site
d’information sur l’internet et première bibliothèque numérique, le
Projet Gutenberg a inspiré bien d’autres bibliothèques numériques au
fil des ans, par exemple le Projekt Runeberg pour la littérature
scandinave ou le Projekt Gutenberg-DE pour la littérature allemande,
pour n’en citer que deux.

La structure administrative et financière du Projet Gutenberg se limite
au strict minimum, avec une devise qui tient en trois mots: «Less is
more.» Michael Hart insiste régulièrement sur la nécessité d’un cadre
aussi souple que possible laissant toute initiative aux volontaires, et
la porte grande ouverte aux idées nouvelles. Le but est d’assurer la
pérennité du projet indépendamment des crédits, des coupures de crédits
et des priorités culturelles, financières et politiques du moment. Pas
de pression possible donc par le pouvoir et par l’argent. Et respect à
l’égard des volontaires, qui sont assurés de voir leur travail utilisé
pendant de nombreuses années, si ce n’est pour plusieurs générations,
d’où l’intérêt d’un format numérique qui soit toujours valable dans
quelques siècles. Le suivi régulier du projet est assuré grâce à une
lettre d’information hebdomadaire et mensuelle, des forums de
discussion, des wikis et des blogs.

Les dons servent à financer des ordinateurs et des scanners, et à
envoyer des CD et DVD gratuits à tous ceux qui en font la demande.
Suite au CD Best of Gutenberg disponible en août 2003 avec une
sélection de 600 titres et à un premier DVD disponible en décembre 2003
avec 9.400 titres, un deuxième DVD est disponible en juillet 2006 avec
17.000 titres. A partir de 2005, CD et DVD sont disponibles sous forme
d'images ISO sur le site de BitTorrent, ces images pouvant être
téléchargées pour graver des CD et DVD sur place à titre personnel. En
2007, le Projet Gutenberg envoie 15 millions de livres par voie postale
sous forme de CD et DVD.

Chose souvent passée sous silence, Michael Hart est le véritable
inventeur de l’ebook. Si on considère l’ebook dans son sens
étymologique, à savoir un livre numérisé pour diffusion sous forme de
fichier électronique, celui-ci aurait bientôt quarante ans et serait né
avec le Projet Gutenberg en juillet 1971. Une paternité beaucoup plus
réconfortante que les divers lancements commerciaux dans un format
propriétaire ayant émaillé le début des années 2000. Il n’y a aucune
raison pour que la dénomination «ebook» ne désigne que l’ebook
commercial et soit réservée aux Amazon, Barnes & Noble, 00h00, Gemstar
et autres. L’ebook non commercial est un ebook à part entière - et non
un parent pauvre - tout comme l’édition électronique non commerciale
est une forme d’édition à part entière - et tout aussi valable que
l’édition commerciale. En 2003, les etexts du Projet Gutenberg
deviennent des ebooks, pour coller à la terminologie ambiante.

En juillet 1971, l’envoi d’un fichier de 5 Ko à cent personnes aurait
fait sauter l’embryon de réseau disponible à l’époque. En novembre
2002, le Projet Gutenberg peut mettre en ligne les 75 fichiers du
"Human Genome Project" (à savoir le séquençage du génome humain),
chaque fichier se chiffrant en dizaines sinon en centaines de méga-
octets. Ceci peu de temps après la parution initiale du Human Genome
Project en février 2001, puisqu’il appartient d’emblée au domaine
public.

En 2004, la capacité de stockage des disques durs est telle qu’il
serait possible de faire tenir l’intégralité de la Library of Congress
au format texte sur un support de stockage coûtant 140 dollars US. Et
quelques années seulement nous sépareraient d’une clé USB (universal
serial bus) permettant de stocker l’intégralité du patrimoine écrit de
l’humanité.

Qu’en est-il des documents autres que l’écrit? En septembre 2003, le
Projet Gutenberg se lance dans la diffusion de livres audio. En
décembre 2006, on compte 367 livres lus par une synthèse vocale (Audio
Book, computer-generated) et 132 livres lus par l’être humain (Audio
Book, human-read). Le nombre de ces derniers devrait régulièrement
augmenter. Par contre, les livres lus par une synthèse vocale ne seront
plus être stockés dans une section spécifique, mais réalisés à la
demande à partir des fichiers électroniques existant dans les
collections générales. Les lecteurs aveugles ou malvoyants pourront à
l'avenir utiliser une commande vocale pour demander le fichier de tel
ou tel livre.

Lancée elle aussi en septembre 2003, la section "Sheet Music
Subproject" est consacrée aux partitions musicales numérisées (Music,
Sheet). Elle est complétée par une section d’enregistrements musicaux
(Music, recorded). Des sections sont également disponibles pour les
images fixes (Pictures, still) et animées (Pictures, moving). Ces
collections devraient être développées dans les prochaines années.

Mais la numérisation des livres reste prioritaire. Et la demande est
énorme. En témoigne le nombre de téléchargements, qui se comptent
désormais en dizaines de milliers par jour. A la date du 31 juillet
2005, on compte 37.532 fichiers téléchargés dans la journée, 243.808
fichiers téléchargés dans la semaine et 1.154.765 fichiers téléchargés
dans le mois. A la date du 6 mai 2007, on compte 89.841 fichiers
téléchargés dans la journée, 697.818 fichiers téléchargés dans la
semaine et 2.995.436 fichiers téléchargés dans le mois. Courant mai, ce
nombre atteint les 3 millions. Ceci uniquement pour le principal site
de téléchargement, ibiblio.org (basé à l’Université de Caroline du
Nord, Etats-Unis), qui héberge aussi le site du Projet Gutenberg. Le
deuxième site de téléchargement est l’Internet Archive, qui est le site
de sauvegarde et qui met à la disposition du Projet Gutenberg une
capacité de stockage illimitée.

Un Top 100 recense les cent titres et les cent auteurs les plus
téléchargés dans la journée, dans la semaine et dans le mois.

Le Projet Gutenberg dispose de 40 sites miroirs répartis dans de
nombreux pays, et il en cherche d’autres. La circulation des fichiers
se fait aussi en mode P2P (peer-to-peer), qui permet d’échanger des
fichiers directement d’un utilisateur à l’autre.

Les livres du Projet Gutenberg peuvent aider à combler la fracture
numérique. Ils sont aisément téléchargeables sur PDA. Un ordinateur ou
un PDA d’occasion ne coûte que quelques dollars ou quelques dizaines de
dollars, en fonction du modèle. Certains PDA fonctionnent à l’énergie
solaire, permettant la lecture dans les régions pauvres et reculées.

Plus tard, il sera peut-être possible d'envisager une traduction
simultanée dans une centaine de langues, en utilisant un logiciel de
traduction automatique qui aurait alors un taux de fiabilité de l’ordre
de 99%, un pourcentage dont on est encore loin. Ce logiciel de
traduction automatique serait relayé par des traducteurs (non pas des
machines, mais des êtres humains), sur un modèle comparable à la
technologie OCR relayée par des correcteurs (non pas des logiciels,
mais des êtres humains) pour offrir un contenu de grande qualité.

38 ans après les débuts du Projet Gutenberg, Michael Hart se définit
toujours comme un fou de travail dédiant toute sa vie à son projet,
qu’il voit comme étant à l’origine d’une révolution néo-industrielle.
Il se définit aussi comme altruiste, pragmatique et visionnaire. Après
avoir été traité de toqué pendant de nombreuses années, il force
maintenant le respect.

Au fil des ans, la mission du Projet Gutenberg reste la même, à savoir
changer le monde par le biais de l’ebook gratuit indéfiniment
utilisable et reproductible, et favoriser ainsi la lecture et la
culture pour tous à moindres frais. Cette mission se résume en quelques
mots: «encourager la création et la distribution d’ebooks», par autant
de personnes que possible, et par tous les moyens. Tout en prenant les
virages nécessaires pour intégrer de nouvelles idées, de nouvelles
méthodes et de nouveaux supports.
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